9章 思考2:帰納的推論
https://gyazo.com/82db38b31bfa5440a46dea1862701d4e
規則性は直接知覚することはできない
仮説検証という帰納的推論
環境の規則性は大概の場合、確率的
確立判断
少しぐらい不正確であっても即座の判断が必要
9-1. 仮説検証
9-1-1. 概念達成
実験者が設定した概念を当てる
概念は複数の図形からなるカテゴリー
81枚のカードから1枚を選び、YES or No
仮説を一つずつ検証
9-1-2. 2-4-6問題
「2 4 6」という3つの数字の規則を当てるために、自分で3つの数字をつくってYes or No
仮説に合わない数列を作れば早く正解にたどり着けるが、仮説にあう数字を作る傾向がある
9-1-3. 確証バイアス
立証バイアスも本質的には同一のバイアス
ウェイソン選択課題も確証バイアスの結果であるようにみえる
9-1-4. 反証主義
すべてのカラスを観察したのでなければ、「すべてのカラスは黒い」と断言できない
仮言命題(hypothetical proposition)が真ならば、否定式も必ず真になる 「P→Q」 ならば「QでなければPではない」
「AがカラスであればAは黒い」という仮言命題の否定式「Aが黒くなければ、Aはカラスではない」を考える
一羽でも黒くないカラスを見つければ、「すべてのカラスは黒い」という一般命題を反証可能。
「科学的研究は、仮説を支持する証拠を見つけるためにではなく、仮説を否定する反証を見つけるように立案すべきだ」(Popper, 1959)
9-1-5. 2-4-6課題再考
正しい規則は「順に大きくなる3つの数字」→正事例の範囲が非常に広い
反証を探すという方法をとっても効率的でない場合や、正事例を作ることによって仮説の間違をみつけることができる場合もある
9-1-6. テストの効率性
2-4-6課題が「反証テストはつねに確証テストよりも有効だ」ということを示していると考えるわけにはいかない。
現実の世界では規則の正事例の範囲は非常に狭いことが多い
「Aがカラスならば、Aは黒い」→反証主義に従うなら黒くないものを調べてはそれがカラスカどうかを確認することになる
確証テストではカラスを調べてはそれが黒いかどうかを確認する
カラスの数はカラスではない物体の数に比べて遥かに少ない
仮説が正しくない事例が存在するとすれば、それを見つける確率はずっと高くなる
9-1-7. 稀少性過程と反証主義
稀少性仮定が当てはまる場合は、確証テストは反証テストよりずっと効率が高い
現実の世界では稀少性仮定が当てはまっている事が多い
確証バイアスは適応的な行動傾向だといえるかもしれない。
現実世界を理解しようとする推論を問題にする場合は推論の特性だけでなく、現実世界の特性をも考慮に入れなければならない。
稀少性仮定が当てはまる場合が多いことも現実世界の特性
観察の問題
「天空の特定の位置に星が存在するはずだ」→望遠鏡で観察したところ、星は見えなかった
仮説は必ずしも間違っているとは言えない。
望遠鏡の性能、暗黒星雲など様々な理由が考えられる。
このような理由で見えなかった場合は、反証されたにも関わらず、仮説は正しい
反証を見つけるための観察手続きには誤りの混入する可能性が常に存在する
反証に基づく仮説の棄却は絶対確実ではありえない。
ポパー自身もある程度は認識していたようである。
様々な変数の働きが複雑に交錯している
ある変数の働きを別の変数が打ち消してしまうということもある
e.g. 万有引力の法則には含まれていない風力という変数も物体には作用する。
反証にみえる事実が観察されても、剰余変数が作用した結果かもしれない。
9-2. 確率推定
9-2-1. 確率推定の役割
具体的な数字でなくても、本質的には確率推定
9-2-2. 確率とはなにか
確率とはなにか→この問題には答えがない
客観的な確率とは一致しない場合もある
人間の行動を左右するのは主観的確率
主観的な確度を確率として扱うためにはいくつのかの条件を満たしていることが必要
0 ~ 1
真 + 偽 = 1
9-2-3. 仮説検証と確率推定
ある40歳の女性がマンモグラム検査を受けたところ、陽性となった。実際に乳癌にかかっている確率は?
40歳の女性が乳癌にかかる確率は1%
乳癌にかかっている女性がマンモグラム検査を受けると検査結果は80%の確率で陽性になる
しかし、乳癌にかかっていない女性が検査を受けても9.6%は陽性になる
9-2-4. ベイズの定理
$ P(H|D) = \frac{P(D|H) \times P(H)}{P(D|H) \times P(H) + P(D|\lnot H) \times P(\lnot H)}
P(H):(データが与えられていないときに)仮説Hが正しい確率
ここでは1%
P(¬H):(データが与えられていないときに)仮説Hが誤っている確率
99%
P(H|D):データDが与えられたという条件のもとで、仮説Hが正しい確率
「検査結果が陽性というデータを与えられたとき、その女性が実際に乳癌にかかっている確率」
P(D|H):仮説が正しいときにデータが得られる確率
「乳癌にかかっている女性がマンモグラム検査を受けたとき、陽性になる確率」
80%
データの確度、検査の場合なら検出率
P(D|¬H):仮説が正しくない時にデータが得られる確率
「乳癌にかかっていなくても陽性になる確率」→偽陽性率
9.6%
9-2-5. 式の意味
分母:「40歳の女性全体んおうち、マンモグラム検査で陽性になる女性の割合」→P(D)と表記することができる
基準率P(H)×データの確度P(D|H)
「40歳女性のうち、実際に乳癌にかかっている1%の女性がマンモグラム検査を受けたとき、そのうち陽性になるのは40歳の女性全体の何%か」
0.8%
P(D|¬H)×P(¬H)
「40歳の女性のうち、乳癌にかかっていない99%の女性がマンモグラム検査を受けたとき、そのうち陽性になるのは40歳の女性全体の何%か」
9.504%
分子:「40歳の女性全体のうち、乳癌にかかっていて陽性になる女性の割合」
9-2-6. 基準率無視
ベイズの定理にもとづく規範解(数学的に正しいと考えられる答)=0.78%
似たような様々な問題で規範解を答える解答者はほとんどいないことがわかっている
9-2-7. 確率 vs. 頻度
「規範解がほとんど出てこないのは、問題が確率のかたちで表現されているからだ」
確率の考えが登場してからたかだか400年程度。
人類は頻度にもとづいて推論を行ってきたに違いない。
人数表記の乳癌問題
9-2-8. 頻度表記とベイズ推定
ギゲレンツァーの実験では正解を出した解答者は40%ぐらい。
この実験では練習効果が著しく、確率表記の場合でも20%知覚にのぼった
各種の問題を通算すると、世界率の平均は確率表記の場合は16%、頻度表記の場合は46%になった
「頻度をつかった推論は、人類が進化の過程で獲得した自然な推論のやり方であって、問題を頻度で表せば、人間はベイズの定理に添った推論もできるのだ」と主張
9-2-9. 頻度理論の問題点
乳癌問題の頻度版は問題文で直に与えられていて計算が不要。
何を計算しなければならないかを考える必要がほとんどない
頻度版では基準率無視が起こらないことは当然のことだとも言える
9-2-10. 頻度問題の改変版
頻度版を計算が必要になるように改変
ベイズの定理の添った規範解を出した解答者は3%に過ぎなかった
確率版を改変して、頻度版と同じように計算の必要性を減らした場合には、規範解が増加することが筆者の実験でわかっている (未発表)
9-2-11. 頻度理論の妥当性
ギゲレンツァーの主張は裏付けられなかったことになる
数学的な確率論が登場したのは確かに16世紀から17世紀だが、主観的な確度は狩猟採集生活においても重要な役割を果たしていたはずである
9-3. ヒューリスティック
9-3-1. ヒューリスティックとアルゴリズム
難解だったり、時間がかかることが多い
アルゴリズムが存在するかどうかがわからない場合も少なくない
カーネマンとトヴェルスキーは人間の判断がヒューリスティックに依存していることを実験で明らかにしてきた
9-3-2. 可用性ヒューリスティック
「英語の単語のなかで、kで始まる単語と3番目の文字がkの単語とは、どちらが多いか?」
多くの人がkで始まる単語と答える
3番目の文字がkは、kで始まる単語の3倍多い
アルゴリズムにあたるのは辞書を調べるという方法
時間と労力、手元に辞書があるかないか
実際にたくさん存在するものは目に触れる機会も多く、その結果たkすあん思い出せることにもなるので、うまくいく場合も多い
9-3-3. 代表性ヒューリスティック
A「銀行の窓口係」or B「女性解放運動に熱心な銀行の窓口係」
BはAの部分集合
「リンダは女性解放運動に熱心な銀行の窓口係である」
代表性→ある事例がカテゴリをどれぐらい代表しているかという程度のこと
あるカテゴリーの多くのメンバーと類似している事例はそのカテゴリに属すると判断するヒューリスティック
リンダは連言命題のほうがよく似ている
はじめて出会った事例をカテゴリーに分類する際、あまり一般的なカテゴリーに分類するより少し限定されたカテゴリーに分類する方が実用的である場合が多い
動物よりも肉食獣、キノコよりも毒キノコとして考えたほうが適応的